Denoising Diffusion Probabilistic Models
DDPM
ノイズを除去するステップを何度も繰り返して元画像を復元するやつ
https://arxiv.org/abs/2006.11239
https://gyazo.com/85989a82a3b2b6b120ade5e485e0415c
Jonathan Ho, Ajay Jain, Pieter Abbeel
2020
We present high quality image synthesis results using diffusion probabilistic models, a class of latent variable models inspired by considerations from nonequilibrium thermodynamics.
非平衡統計力学の考察に触発された潜在変数モデルのクラスである拡散確率モデルを用いた高品質な画像合成の結果を発表する
Our best results are obtained by training on a weighted variational bound designed according to a novel connection between diffusion probabilistic models and denoising score matching with Langevin dynamics, and our models naturally admit a progressive lossy decompression scheme that can be interpreted as a generalization of autoregressive decoding.
我々の最良の結果は、拡散確率モデルとランジュバン動力学によるノイズ除去のスコアマッチングとの間の新く提案した接続に従って設計された重み付き変分境界で学習することによって得られ、
我々のモデルは自己回帰復号の一般化として解釈できる漸進的損失伸長方式を自然に認める。
On the unconditional CIFAR10 dataset, we obtain an Inception score of 9.46 and a state-of-the-art FID score of 3.17.
On 256x256 LSUN, we obtain sample quality similar to ProgressiveGAN. Our implementation is available at this https URL
無条件CIFAR10データセットにおいて、Inceptionスコア9.46、FIDスコア3.17を得ることができました。
256x256 LSUNでは、ProgressiveGANと同程度のサンプル品質が得られている
解説
https://speakerdeck.com/nhamanasu/diffusionniyorutext2imagenoxi-pu-tosheng-cheng-hua-xiang-gadong-kichu-sumade?slide=16
素人向けの解説
https://huggingface.co/blog/annotated-diffusion
実装レベルの解説
結局ちゃんと理解できるのは実装
https://xtrend.nikkei.com/atcl/contents/technology/00007/00042/
https://ja.stateofaiguides.com/20221012-stable-diffusion/
この論文、いきなり読み始めると、大量の数式と難しい概念が出てきて挫折してしまう可能性が高いため、拡散モデルの概要を他の論文やチュートリアル等でおおよそ理解してから挑戦することをオススメします。
noise conditional score networksを知っておくほうがいいらしい
元画像にノイズをT回のせる(foward process/diffusion process)
その画像を復元する(reverse process)
復元した画像と予測の差分を損失関数とする
https://www.youtube.com/watch?v=10ki2IS55Q4
https://www.youtube.com/watch?v=9Eu8WvKmkRA
@minux302: (3/5) https://t.co/zY1ZAq7NTC
https://pbs.twimg.com/media/Fd-qO_TakAAt_45.jpg
https://pbs.twimg.com/media/Fd-qO_7acAENZi-.jpg
https://pbs.twimg.com/media/Fd-qPAgaMAAsgTP.jpg/
@minux302: (4/5) https://t.co/yFgoC2LUVV
https://pbs.twimg.com/media/Fd-qTrQacAIelhn.jpg
https://pbs.twimg.com/media/Fd-qTr0akAEKFq6.jpg
https://pbs.twimg.com/media/Fd-qTsQakAAM7fG.jpg
https://pbs.twimg.com/media/Fd-qT8gaYAEZS_t.jpg
@minux302: (5/5) https://t.co/x3udSkxvZj
https://pbs.twimg.com/media/Fd-qbvGaAAYhwKZ.jpg
classifier-free guidance
https://pbs.twimg.com/media/Fd-qbvqagAA8Dw6.jpg
https://pbs.twimg.com/media/Fd-qbwTaEAYqnhP.jpg
https://pbs.twimg.com/media/Fd-qbw4aEAEowdQ.jpg/